据说有RNN和CNN结合的xDeepFM

文章目录

介绍

也是一篇在CTR预估中堆Deep层数的轮子文，先来了解一下：

不过xDeepFM所提出的点是结合RNN和CNN的特性完成多阶特征的抽取，并且最终和和DNN以及Linear整合到一起完成显性特征的使用。

据说有RNN和CNN结合的xDeepFM中最重要的核心元素是CIN（Compressed Interaction Network）
一个图来解释CIN:

这里：

这儿CIN各种复杂度：

他的参数复杂度是:$\sum_{k=1}^T H_k \times (1+H_{k-1} \times m)$
- $T$表示CIN的总层数
- 每一层的W参数是$H_k \times H_{k−1} \times m$
- 顶部线性成的参数量是$H_k$
他的计算复杂度是:$O(mH^2DT)$
- 他单层的$Z^{k+1}$的计算复杂度是$O(mHD)$
- 并且额外的我们还需要将feature maps汇聚到$H$个隐藏节点

最终的xDeepFM的大结构是参考了Wide&Deep的方式:

最左侧是一个线性模型（其实这儿是一个稀疏层）
中间是上面刚刚描述的CIN模型
最右侧其实就是一个传统的DNN模型了
最终将所有的隐藏层的值合并进行了计算：$$y=\sigma(W_{\text{linear}}^T a + W_{\text{dnn}}^T x_{\text{dnn}} + W_{\text{cin}}^Tp^+ + b)$$

他和DeepFM的关系：如果将CIN这一层里面的层数改为1，他其实就是一个FM

里面描述的实验结果中，

看起来xDeepFM还是有一些提升的，不过主要提升是在DianPing数据集上，另外两个数据集提升的还是很微弱，在这种复杂度下，计算性能和带来的效果回报的受益就比较低了。

感觉xDeepFM主要引入了Deep&Cross里面的Cross机制，就是在做堆叠
另外其实看到堆叠和交叉还是能带来一定效果的，但是受益越来越不明显了，如果运行性能和算法性能的性价比，FM无疑是最高，但是Deep模型可以说故事（chui）啊
作者开放了源码，赞一个

Lian, Jianxun, et al. “xDeepFM: Combining Explicit and Implicit Feature Interactions for Recommender Systems.” arXiv preprint arXiv:1803.05170 (2018).